Cuadro de mandos

1 Introducción

Millones de personas en Europa se desplazan por motivos de trabajo, un fenómeno conocido como movilidad laboral o commuting. Este movimiento es fundamental para la economía, ya que conecta a las empresas con el talento que necesitan. Sin embargo, también es un reflejo de desequilibrios: la congestión en ciertas zonas y el vaciado económico en otras, junto con el impacto ambiental, demuestran que la forma en que se distribuyen el trabajo y el talento es un reto clave.

El objetivo de este proyecto es ir más allá del simple desplazamiento y analizar las conexiones del mercado laboral europeo. Buscamos entender no solo dónde se mueve la gente, sino por qué, y cómo la cualificación profesional de los trabajadores influye en estas dinámicas de desplazamiento. Comprender estos patrones de empleo es esencial para diseñar políticas que promuevan un desarrollo regional más equitativo y una movilidad sostenible.

1.1 Justificación de la Ampliación de Fuentes

1.1.1 El Dataset Principal

Título: Employed persons by place of work, Eurostat (2025). Código: lfst_r_lfe2ecomm.

Disponible en: https://ec.europa.eu/eurostat/databrowser/view/lfst_r_lfe2ecomm/default/table?lang=en

Para analizar la compleja dinámica del empleo y la movilidad en Europa, este proyecto se fundamenta en la integración de dos conjuntos de datos clave de Eurostat.

El primer objeto de análisis es el dataset de flujos de commuting, cuyo propósito es establecer el “dónde” y el “cuánto” de la movilidad laboral. Este conjunto de datos mapea las rutas y la cantidad absoluta de personas que se desplazan a diario entre diferentes regiones, permitiendo identificar las rutas de movilidad más activas y las áreas de mayor dependencia económica de trabajadores.

1.1.2 Valor añadido del dataset complementario

Limitarse solo a los flujos de empleo es insuficiente en este caso, pues solo muestra el movimiento sin explicar la razón subyacente. Por ello, el análisis se complementa con el dataset sobre nivel educativo (código eurostat lfst_r_lfe2eedu). Esta segunda fuente introduce la variable de la cualificación del talento y su distribución geográfica. Nos permite abordar el “por qué” de la movilidad, al relacionar si la necesidad de desplazarse está influenciada por el nivel educativo o por la concentración de empleo cualificado en determinadas regiones. Creo que este enfoque será de gran utilidad para obtener conclusiones sólidas que no solo se centren en la infraestructura, sino también en la planificación y diseño de políticas regionales más equitativas.

1.2 Estado actual

1.2.1 Relevancia y Oportunidad del Estudio

Este análisis es urgente y oportuno. El mercado laboral europeo atraviesa una transformación marcada por la subida de precios de la vivienda en centros urbanos, que fuerza a muchos trabajadores a realizar desplazamientos largos, y por la consolidación del teletrabajo tras la pandemia.

A su vez, la movilidad laboral masiva es un obstáculo clave para la sostenibilidad: los desplazamientos laborales representan una parte significativa de las emisiones contaminantes en Europa.

Este estudio llega en el momento perfecto para influir en las decisiones políticas. Podremos identificar regiones que corren el riesgo de quedar desconectadas económicamente de algunos gobiernos. Además, la investigación se alinea perfectamente con los fondos europeos 2021-2027 (como el Pacto Verde y NextGenerationEU), que priorizan la doble transformación digital y ecológica.

1.3 Motivación

Como estudiante de Ciencia e Ingeniería de Datos, este tema me permite aplicar técnicas avanzadas de visualización y exploración de datos con tablas de datos reales de Eurostat. Es un proyecto donde puedo trabajar con datos espaciales complejos y crear visualizaciones que muestren patrones territoriales, y está muy orientado a la geografía, tema de gran interés en lo personal.

Me interesa personalmente porque afecta la vida diaria de millones de personas. Veo cómo los largos desplazamientos al trabajo impactan en la calidad de vida y el medio ambiente. Quiero entender estas dinámicas para contribuir a mejores políticas públicas.

Profesionalmente, este trabajo conecta con áreas en crecimiento como el análisis de datos espaciales y la ciencia de datos para el bien social. Como futuro ingeniero de datos, busco proyectos donde la técnica sirva a un propósito social claro, y este es un ejemplo perfecto.

1.4 Objetivos

1.4.1 Propósito Principal

El objetivo principal de este proyecto es generar información útil para tomar decisiones sobre el empleo en Europa. Para esto, nos centraremos en analizar los patrones de movilidad laboral —es decir, los desplazamientos de la gente al trabajo— y cómo estos se relacionan con el nivel de formación de los trabajadores. Buscamos identificar las rutas de viaje más importantes y las regiones que dependen más unas de otras para trabajar. Al entender cómo influye la cualificación en la necesidad de moverse, podremos crear un conjunto de gráficos y herramientas visuales sencillas. El resultado final será proponer ideas concretas para que las políticas públicas inviertan mejor y resuelvan los problemas de sostenibilidad generados por estos viajes masivos.

2 Aportaciones del trabajo

2.1 Principales aportaciones

La principal aportación de este proyecto es la visualización de datos a través del cuadro de mandos. Reúne en un solo lugar fuentes como Eurostat e ISTAC, permitiendo consultar de forma sencilla indicadores sobre educación y empleo. Frente a los informes estáticos tradicionales, esta herramienta permite una exploración dinámica, facilitando a cualquier usuario, independientemente de su perfil técnico, la consulta de indicadores clave sobre educación y movilidad laboral.

Metodológicamente, el proyecto integra distintas escalas geográficas, combinando la estructura europea (NUTS) con la realidad de Canarias. Esto permite comparar la situación del archipiélago con Europa y analizar las diferencias entre las islas. Además, incorpora modelos de predicción y análisis de patrones para ofrecer perspectivas que antes requerían conocimientos avanzados en estadística.

En términos prácticos, la herramienta muestra cómo la formación educativa se relaciona con la contratación, proporcionando evidencia visual que puede orientar decisiones y políticas públicas para mejorar la estabilidad del empleo y reducir la estacionalidad económica.

2.2 Alineamiento con los objetivos de desarrollo sostenible

El estudio de cómo se desplazan las personas al trabajo en Europa nos permite entender mejor la vida de millones de ciudadanos. Analizar los tiempos y distancias de los desplazamientos no solo refleja la organización de nuestras ciudades, sino también cómo se distribuyen las oportunidades laborales. En muchos casos, largos trayectos diarios pueden dificultar la conciliación entre la vida personal y profesional, mostrando que no todos tienen las mismas facilidades para acceder a un empleo cercano. Este aspecto se relaciona directamente con el ODS 8, Trabajo decente y crecimiento económico, porque los desplazamientos influyen en la calidad y el acceso al empleo.

Además, la manera en que nos movemos tiene un impacto directo en nuestro entorno y en el clima. Elegir caminar, usar la bicicleta o el transporte público en lugar del coche no solo ahorra tiempo y dinero, sino que también ayuda a reducir la contaminación y a hacer que las ciudades sean más agradables para vivir. Analizar estos patrones de commuting contribuye al ODS 13, Acción por el clima, al proporcionar información para reducir emisiones y fomentar una movilidad más sostenible. Al mismo tiempo, permite identificar áreas donde la infraestructura de transporte necesita mejoras, apoyando el ODS 9, Industria, innovación e infraestructura, ya que planificar mejor las redes de transporte puede hacer que los desplazamientos sean más eficientes, seguros e inclusivos.

Este análisis también ayuda a revelar desigualdades invisibles. Por ejemplo, algunas zonas de Europa ofrecen muchas oportunidades de empleo cerca del hogar, mientras que otras obligan a largas horas de viaje. Esto afecta de manera diferente a hombres y mujeres, y puede influir en la manera en que las familias organizan su día a día. Conocer estas diferencias está relacionado con el ODS 5, Igualdad de género, porque permite pensar en soluciones que hagan la movilidad más justa para todos.

Grado de relación del proyecto con los objetivos de desarrollo sostenible (ODS)
ODS No procede Bajo Medio Alto
1 Fin de la Pobreza X
2 Hambre cero X
3 Salud y Bienestar X
4 Educación de calidad X
5 Igualdad de género X
6 Agua limpia y saneamiento X
7 Energía Asequible y no contaminante X
8 Trabajo decente y crecimiento económico X
9 Industria, Innovación e Infraestructuras X
10 Reducción de las desigualdades X
11 Ciudades y comunidades sostenibles X
12 Producción y consumo sostenibles X
13 Acción por el clima X
14 Vida submarina X
15 Vida de ecosistemas terrestres X
16 Paz, justicia e instituciones sólidas X
17 Alianzas para lograr objetivos X

3 Desarrollo

3.1 Herramientas empleadas

Para el análisis se ha utilizado R junto con RStudio, que proporcionan un entorno para el manejo de datos, análisis estadístico y visualización. Se han empleado diversas librerías y herramientas que permiten abordar distintos aspectos del proyecto: openxlsx para la lectura de archivos Excel; pxR para la exploración de datos en formato PX; highcharter y plotly para la creación de gráficos dinámicos; fpp3 y tsibble para el análisis y modelado de series temporales; leaflet y geojsonio para la elaboración de mapas interactivos; ggplot2 y tidyverse para la manipulación de datos y creación de gráficos estáticos; flexdashboard para el despliegue del cuadro de mandos; la función de help de R para soporte y documentación integrada; y modelos de inteligencia artificial como GPT y Gemini para sugerencias y correcciones de código. El cuadro de mandos resultante se ha desplegado públicamente mediante el servidor Shiny del DIS de la ULPGC, garantizando la accesibilidad remota de los resultados.

3.2 Metodología

Utilizaremos la metodología de desarrollo CRISP-DM (Cross Industry Standard Process for Data Mining) que es un marco ampliamente utilizado para proyectos de Ciencias de Datos. En la siguiente figura se presenta un diagrama con las diferentes fases de esta metodología que a continuación describimos con más detalle:

Diagrama metodología de desarrollo CRISP-DM

  • Comprensión del negocio. Se plantean los objetivos del proyecto y la búsqueda de información y datos.

  • Comprensión de los datos. Se analiza la estructura y organización de los datos obtenidos. Se identifican posible problemas como datos faltantes, outliers o inconsistencias.

  • Preparación de los datos. Se realiza limpieza, transformación, combinación y selección/creación de variables relevantes para el análisis

  • Modelado. Selección y aplicación de los modelos adecuados para analizar los datos

  • Evaluación. Evaluar si el modelo responde a las preguntas de investigación, comparación con otros métodos

  • Despliegue. Comunicación del trabajo en una memoria y diseño y elaboración de un cuadro de mandos para presentar los resultados de forma eficaz y atractiva.

Es importante observar que esta metodología es iterativa, es decir que los resultados obtenidos en algunas de las fases puede afectar al desarrollo de fases anteriores.

A continuación se describirá en detalle como se han abordado cada una de las fases del desarrollo del proyecto siguiendo esta metodología.

3.3 Comprensión del negocio: entre la eficiencia económica y la sostenibilidad

3.3.1 Contexto Actual

Actualmente, existe una creciente fragmentación espacial entre los lugares donde reside la gente y donde se concentra el empleo. Esta transformación estructural está profundamente influenciada por las políticas de integración europea y por la configuración de los mercados laborales regionales. Es en este contexto donde la concentración de empleo cualificado y la distribución del talento se convierten en elementos clave de estudio.

3.3.2 La Paradoja del Commuting Moderno

Mientras la movilidad laboral es esencial para la optimización económica y una concordancia eficiente entre talento y empleo, su crecimiento exponencial genera graves problemas que amenazan la sostenibilidad. Hay desequilibrios territoriales crecientes entre regiones receptoras y emisoras de trabajadores, presión sobre infraestructuras de transporte y sistemas medioambientales, y costes humanos en calidad de vida y salud.

3.3.3 Relevancia y Problema de Investigación

Este problema se sitúa en el centro otros de debates cruciales como la crisis de la vivienda (el commuting como respuesta a la imposibilidad de residir cerca de los centros de empleo cualificado), transición ecológica (los desplazamientos laborales representan aproximadamente el 25% de las emisiones de transporte en la UE) y desigualdad entre regiones; zonas muy ricas en empleo y otras “ciudades dormitorio”.

3.3.4 Búsqueda y Fuentes Consultadas

El proceso se centró en asegurar que los datos fuesen oficiales, estandarizados y comparables a nivel europeo, lo que me llevó a que la entidad principal consultada fue Eurostat, la oficina de estadística de la Unión Europea. La búsqueda se enfocó en encontrar datos a nivel regional (códigos NUTS). Además revisé artículos académicos de organismos como la OCDE para comprender los estudios precedentes sobre commuting y la segregación laboral por nivel educativo. Esto ayudó a refinar la hipótesis del proyecto. El apartado final del cuadro de mandos fue elaborado mediante la base de datos “Demandas de empleo según sexos y niveles de estudios. Islas de Canarias por meses” del Instituto Canario de Estadística (ISTAC).

3.3.5 Importancia del Análisis a Nivel NUTS 2

La escala regional NUTS 2 es la unidad óptima para este análisis, ya que corresponde al nivel donde se diseñan e implementan las políticas regionales europeas: diseñar estrategias de planificación territorial coordinada, optimizar inversiones en infraestructuras de transporte y desarrollar políticas de vivienda y desarrollo económico integradas.

3.4 Comprensión de los datos

3.4.1 Validación del dataset principal

Objetivos: Analizar la dinámica del desplazamiento laboral entre regiones (intraregional / interregional / internacional).

Comparar la magnitud del commuting por sexo, edad o región.

Ver tendencias temporales: si aumenta o disminuye el commuting en determinadas regiones.

Relacionarlo con variables como densidad de población, nivel educativo, o condiciones laborales.

Limitaciones / aspectos a tener en cuenta: No da información detallada de desplazamiento, costos o tiempo de viaje, solo la cantidad de personas. Además puede haber diferencias de calidad de cobertura entre países/regiones, sobre todo en regiones pequeñas.

  • Resumen : Ofrece información estadística detallada sobre la población ocupada en función de su lugar de residencia y de trabajo. Su estructura contempla variables que permiten desagregar los resultados por sexo, grupo de edad, unidad de medida, región de residencia (a nivel NUTS 2) y localización del puesto de trabajo, con categorías que distinguen entre empleo en la misma región, en otra región del país o en el extranjero. Los datos se presentan con periodicidad anual y se expresan en miles de personas, lo que facilita un análisis coherente y comparativo entre territorios.

  • Utilidad: La utilidad principal de este dataset radica en su capacidad para analizar los patrones de movilidad laboral y los desplazamientos por motivos de trabajo dentro y fuera de los países europeos. Constituye una herramienta clave para la planificación territorial, el diseño de políticas de transporte y empleo, y la evaluación de la cohesión económica y social entre regiones. Asimismo, permite identificar dinámicas diferenciadas según sexo y edad.

Variables del dataset principal:

## tibble [311,020 × 8] (S3: tbl_df/tbl/data.frame)
##  $ freq       : chr [1:311020] "A" "A" "A" "A" ...
##  $ age        : chr [1:311020] "Y15-64" "Y15-64" "Y15-64" "Y15-64" ...
##  $ c_work     : chr [1:311020] "FOR" "FOR" "FOR" "INR" ...
##  $ sex        : chr [1:311020] "F" "M" "T" "F" ...
##  $ unit       : chr [1:311020] "THS_PER" "THS_PER" "THS_PER" "THS_PER" ...
##  $ geo        : chr [1:311020] "AT" "AT" "AT" "AT" ...
##  $ TIME_PERIOD: Date[1:311020], format: "1999-01-01" "1999-01-01" ...
##  $ values     : num [1:311020] 12 30.2 42.1 1404.7 1706.9 ...

Este dataset contiene información anual relativa a personas empleadas que se desplazan de su lugar de residencia al lugar de trabajo, es decir trabajadores que hacen commuting. Aparte del número de personas (o magnitud del commuting), también se puede desglosar por distintos criterios: sexo (hombres / mujeres), grupo de edad, región (a nivel NUTS 2), y país donde trabajan (incluido trabajo dentro de la misma región o en otra región / país). La unidad de medida es “miles de personas” (THS_PER) y la frecuencia es anual.

3.4.2 Descripción variables categóricas

  • freq: frecuencia con la que se toman las observaciones. Tiene un único valor “A”, que corresponde a datos anuales.

  • TIME_PERIOD: año de referencia de la observación estadística.

  • sex: sexo del beneficiario. Tiene 3 valores posibles: “F” femenino, “M” masculino y “T”, total.

  • age: grupo de edad del beneficiario. Tiene como valores posibles tramos de edad, se usan varias categorías como Y15-64 (personas de 15 a 64 años), Y20-64 (de 20 a 64 años) o Y_GE15 (15 años o más).

  • c-work: región / país de trabajo — define dónde trabaja la persona en relación con su región de residencia. Algunas categorías posibles son:

    • INR: trabaja en la misma región NUTS 2.
    • OUTR: trabaja en otra región dentro del país.
    • FOR: trabaja en un país extranjero.
    • NRP: sin respuesta (“No response”).
  • values: Mide cuántas personas empleadas, según los criterios anteriores, se encuentran en una de las categorías de c_work. Por ejemplo, cuántas viven en la región X, tienen entre 15-64 años, son mujeres, y trabajan fuera de su región (“otra región”) o en extranjero, etc.

  • unit: esta variable determina lo que se está midiendo en la observación (es decir lo que significa el valor de la variable values). Se usa “THS_PER” que significa mil personas (“thousands of persons”). Para facilitar la compresión del análisis, durante todo el tratamiento de datos se mantendrá las unidades en miles tanto en las gráficas de la memoria como en el cuadro de mandos. Sólo se trabajará con el valor real a la hora de calcular porcentajes.

  • geo: Geografía / región de residencia. Es la región NUTS 2 (o equivalente) donde la persona reside, para cada país participante.

El dataset se encuentra en formato “tidy”, es decir, un valor por registro/fila.

Número de observaciones por cada valor que pueden tomar las variables:

## COLUMNA: freq 
##      freq N.Observ full_name
## [1,] A    311020   Annual
## COLUMNA: age 
##      age    N.Observ full_name          
## [1,] Y_GE15 103793   15 years or over   
## [2,] Y15-64 103693   From 15 to 64 years
## [3,] Y20-64 103534   From 20 to 64 years
## COLUMNA: c_work 
##      c_work N.Observ full_name         
## [1,] INR    104838   In the same region
## [2,] OUTR    94335   In another region 
## [3,] FOR     82444   Foreign country   
## [4,] NRP     29403   No response
## COLUMNA: sex 
##      sex N.Observ full_name
## [1,] T   106214   Total    
## [2,] M   104992   Males    
## [3,] F    99814   Females
## COLUMNA: unit 
##      unit    N.Observ full_name       
## [1,] THS_PER 311020   Thousand persons
## 
## CONTABILIZACIÓN Nº REGIONES NUTS A PARTIR DE LA COLUMNA geo
##      NUTS      Number of Regions
## [1,] 0          35              
## [2,] 1         111              
## [3,] 2         290              
## [4,] EA20        1              
## [5,] EU27_2020   1              
## [6,] OTHERS     74              
## 
## COLUMNA: TIME_PERIOD 
##       TIME_PERIOD N.observ
##  [1,] 1999-01-01   8852   
##  [2,] 2000-01-01   9068   
##  [3,] 2001-01-01   9265   
##  [4,] 2002-01-01   9668   
##  [5,] 2003-01-01  10269   
##  [6,] 2004-01-01  11001   
##  [7,] 2005-01-01  12118   
##  [8,] 2006-01-01  13054   
##  [9,] 2007-01-01  13031   
## [10,] 2008-01-01  12616   
## [11,] 2009-01-01  12553   
## [12,] 2010-01-01  12656   
## [13,] 2011-01-01  12638   
## [14,] 2012-01-01  12746   
## [15,] 2013-01-01  12914   
## [16,] 2014-01-01  12930   
## [17,] 2015-01-01  12928   
## [18,] 2016-01-01  12935   
## [19,] 2017-01-01  12944   
## [20,] 2018-01-01  13049   
## [21,] 2019-01-01  13169   
## [22,] 2020-01-01  12298   
## [23,] 2021-01-01  12426   
## [24,] 2022-01-01  12078   
## [25,] 2023-01-01  12048   
## [26,] 2024-01-01  11766

Omitiremos las variables freq y unit durante todo el análisis.

3.4.3 Percentiles de la distribución de tamaños de las series temporales

Observamos que el máximo tamaño de las series temporales es 5 y además menos del 10% tienen ese tamaño.

## # A tibble: 1 × 7
##     min   p10   p25   p50   p75   p90   max
##   <int> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
## 1     1     4    12    21    26    26    26

3.4.4 Distribución del nº de observaciones por regiones

Observamos que, para España, el nº de observaciones supera el p75 de la distribución; aunque, si fueramos a hacer el estudio para regiones NUTS 2, no lo cumpliría pues para Canarias tiene 693 observaciones (menor que p75)

Percentiles de la distribución del nº de observaciones por regiones

## # A tibble: 1 × 7
##     min   p10   p25   p50   p75   p90   max
##   <int> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
## 1    54  326.  515.   669   738   810   918

Nº de observaciones en España/Canarias

## # A tibble: 3 × 3
##   geo   full_name N.Observ
##   <chr> <chr>        <int>
## 1 ES    Spain          738
## 2 ES7   Canarias       693
## 3 ES70  Canarias       693

3.4.5 Combinaciones de las variables categóricas

## # A tibble: 4 × 6
## # Groups:   freq, c_work [4]
##   freq  c_work unit    N.observ init.date  end.date  
##   <chr> <chr>  <chr>      <int> <date>     <date>    
## 1 A     INR    THS_PER   104838 1999-01-01 2024-01-01
## 2 A     OUTR   THS_PER    94335 1999-01-01 2024-01-01
## 3 A     FOR    THS_PER    82444 1999-01-01 2024-01-01
## 4 A     NRP    THS_PER    29403 1999-01-01 2024-01-01

3.4.6 Visualización España/Canarias (máximo 60 columnas y 1000 filas por región)

3.4.7 Dataset complementario

Datos básicos del dataset

  • code: lfst_r_lfe2eedu
  • title: Employment by sex, age, educational attainment level and NUTS 2 region (1 000)
  • last.update.of.data: 12.06.2025
  • data.start: 1999
  • data.end: 2024
  • values: 781.019

Descripción variables categóricas

Este dataset contiene valores de empleo de la población en edad de trabajar, desagregadas por sexo, edad, nivel educativo, ciudadanía (o país de origen) y región NUTS 2.

En otras palabras, proporciona el número absoluto de personas que está empleada dentro de cada subgrupo, siendo la variable más importante “isced11”. Esta variable de niveles educativos se refiere a la clasificación ISCED (por ejemplo, educación primaria, secundaria, terciaria). Para mí es fundamental hacer está distinción; los valores para esta variable no son el total de personas educadas con cierto nivel, sino el total de personas empleadas con esos estudios para cada año y región.

También está considerada la ciudadanía / nacionalidad / país de origen (por ejemplo, nacionales vs no nacionales) para ver diferencias en empleo según migración. El dataset se encuentra en formato “tidy”, es decir, un valor por registro/fila.

## COLUMNA: freq 
##      freq N.Observ full_name
## [1,] A    906105   Annual
## COLUMNA: unit 
##      unit    N.Observ full_name       
## [1,] THS_PER 906105   Thousand persons
## COLUMNA: sex 
##      sex N.Observ full_name
## [1,] T   304633   Total    
## [2,] M   302331   Males    
## [3,] F   299141   Females
## COLUMNA: age 
##      age    N.Observ full_name          
## [1,] Y_GE15 154080   15 years or over   
## [2,] Y15-74 154077   From 15 to 74 years
## [3,] Y15-64 154046   From 15 to 64 years
## [4,] Y25-64 153343   From 25 to 64 years
## [5,] Y15-24 150479   From 15 to 24 years
## [6,] Y65-74 140080   From 65 to 74 years
## COLUMNA: isced11 
##      isced11 N.Observ full_name                                 
## [1,] TOTAL   210204   All ISCED 2011 levels                     
## [2,] ED0-2   208887   Less than primary, primary and lower sec..
## [3,] ED3_4   207779   Upper secondary and post-secondary non-t..
## [4,] ED5-8   207091   Tertiary education (levels 5-8)           
## [5,] NRP      72144   No response                               
## 
## CONTABILIZACIÓN Nº REGIONES NUTS A PARTIR DE LA COLUMNA geo
##      NUTS      Number of Regions
## [1,] 0          35              
## [2,] 1         111              
## [3,] 2         290              
## [4,] EA20        1              
## [5,] EU27_2020   1              
## [6,] OTHERS     74              
## 
## COLUMNA: TIME_PERIOD 
##       TIME_PERIOD N.observ
##  [1,] 1999-01-01  29939   
##  [2,] 2000-01-01  30081   
##  [3,] 2001-01-01  30809   
##  [4,] 2002-01-01  31192   
##  [5,] 2003-01-01  31571   
##  [6,] 2004-01-01  31376   
##  [7,] 2005-01-01  31880   
##  [8,] 2006-01-01  34734   
##  [9,] 2007-01-01  35657   
## [10,] 2008-01-01  36223   
## [11,] 2009-01-01  36268   
## [12,] 2010-01-01  36789   
## [13,] 2011-01-01  37119   
## [14,] 2012-01-01  37161   
## [15,] 2013-01-01  38436   
## [16,] 2014-01-01  38212   
## [17,] 2015-01-01  38261   
## [18,] 2016-01-01  38135   
## [19,] 2017-01-01  38164   
## [20,] 2018-01-01  38153   
## [21,] 2019-01-01  38480   
## [22,] 2020-01-01  33990   
## [23,] 2021-01-01  33504   
## [24,] 2022-01-01  33380   
## [25,] 2023-01-01  33518   
## [26,] 2024-01-01  33073

3.4.8 Dataset del ISTAC para el apartado Canarias

## [1] "Valores para variable sexo: Total, Hombres, Mujeres"
## [1] "Territorios: Canarias, Lanzarote, Fuerteventura, Gran Canaria, Tenerife, La Gomera, La Palma, El Hierro"
## [1] "Niveles educativos: Total, Sin estudios, Estudios primarios, Estudios primarios incompletos, Estudios primarios completos, Estudios secundarios, Formación profesional, Educación general, Estudios post-secundarios, Técnico profesional superior, Primer ciclo, Segundo y tercer ciclo, Resto de estudios post-secundarios"
## [1] "Valores para la variable tipo de contrato: Total, Contrato indefinido, Contrato temporal"

Descripción variables categóricas

Periodo: Esta variable establece el marco temporal del conjunto de datos. Presenta una frecuencia mensual que se extiende desde el año 2015 hasta el 2022, permitiendo el análisis de la evolución y las tendencias estacionales.

Territorios: Esta variable define la ubicación geográfica de los datos dentro del archipiélago. Incluye el agregado total para Canarias y desglosa la información específicamente para las islas de Lanzarote, Fuerteventura, Gran Canaria, Tenerife, La Gomera, La Palma y El Hierro.

Sexo: Esta variable demográfica permite desagregar la población en dos grupos biológicos principales, Hombres y Mujeres, además de ofrecer una categoría de Total que agrupa a ambos para facilitar la visión de conjunto.

Niveles educativos: Esta variable clasifica a las personas según el grado de formación académica alcanzado. Su espectro es muy amplio, comenzando por personas sin estudios o con estudios primarios (completos e incompletos), pasando por la educación secundaria, educación general y formación profesional. En el nivel superior, abarca estudios post-secundarios, técnico profesional superior y educación universitaria de primer, segundo y tercer ciclo.

Tipo de contrato: Esta variable categoriza la naturaleza jurídica de la relación laboral existente. Se divide en contrato indefinido y contrato temporal, ofreciendo también un valor Total.

3.5 Preparación de los datos

3.5.1 Análisis en Europa

Países con mayor número de personas que han hecho commuting durante el año 2024

Alemania lidera la clasificación, superando la barrera de los 40.000 valores totales, lo que indica una intensidad de tránsito muy superior al resto. Le siguen con cifras significativas Turquía y Francia, que se sitúan en un rango alto cercano a los 30.000, mientras que Italia y España ocupan una posición intermedia con valores que rondan los 20.000 y 25.000 respectivamente.


Personas que hacen commuting en Europa en el 2024

El gráfico ilustra la distribución por género de los desplazamientos. Los hombres representan el 55,3% del total (con una cifra absoluta superior a 139.400) frente a las mujeres, que constituyen el 44,7% (aproximadamente 112.500). Esta diferencia de más de diez puntos porcentuales señala una brecha significativa en la movilidad laboral, la participación femenina es notablemente inferior a la masculina.


Distancia (c_work) de commuting en el 2024

La mayoría de los desplazamientos laborales se realizan dentro del entorno cercano, ya que el 93% de las personas trabaja en su misma región de residencia, lo que equivale a más de 234.000 trabajadores en el último año.


Volumen de empleo fuera de región local por proporción de habitantes en 2024

Más del 80% de la población belga se desplaza fuera de su región por motivos laborales

Bélgica lidera la clasificación con la proporción más alta, acercándose al 90% de trabajadores empleados fuera de su zona de residencia, seguida por Suiza. Se observa un bloque central muy parejo compuesto por Hungría, Países Bajos, Alemania, Austria y Dinamarca, cuyas cifras oscilan entre el 50% y el 60%. Cabe destacar que en esta comparativa de alta movilidad no figura España, lo que indica que sus proporciones de empleo fuera de la región local son inferiores a las de estas naciones noreuropeas y centrales.


Número de trabajadores en cada país según nivel educativo

La educación secundaria suele agrupar los mayores volúmenes de empleo. Sin embargo, la atención se centra drásticamente en España dentro de la categoría de educación primaria, donde aparece como un valor atípico en la parte más alta de la escala. Con una cifra que supera los 6,3 millones de personas, España se desvía de la tendencia general, indicando que su mercado laboral absorbe una cantidad de trabajadores con formación básica bastante alta en comparación con el resto de los países. Además, España sobresale en el bloque de educación superior, con un volumen de empleo que supera los 10,1 millones de personas.


Evolución países con mayor número de personas con educación superior

Durante la evolución Alemania y Francia se sitúan líderes, y destaca la sólida posición de España, que se consolida en el tercer lugar.


Mapa cantidad de personas empleadas con estudios superiores

El mapa está coloreado en función del ratio de población, no en valores absolutos. Podemos ver que los países con mejores condiciones de empleo para personas con estudios superiores son los países nórdicos.


3.5.2 Regiones españolas y Canarias

Commuting por regiones españolas

Llama la atención Castilla-La Mancha, que presenta el valor más alto en desplazamientos hacia “Otra región”, indicando una fuerte salida de trabajadores hacia comunidades vecinas. Por el contrario, potencias económicas como Madrid, Cataluña y Andalucía Occidental dominan el movimiento interno (“Misma región”) y lideran también las conexiones laborales con “Otro país”. En el caso específico de Canarias, la gráfica refleja claramente su condición insular: la movilidad se restringe casi exclusivamente al interior de la propia región, con una actividad prácticamente nula hacia otras comunidades o el extranjero en comparación con la península.


Evolución de ratio de empleo por nivel educativo en Canarias

La evolución del mercado laboral en Canarias ha sufido un cambio estructural durante los últimos años. Se observa un desplome en la empleabilidad de los perfiles con solo educación primaria, que han pasado de liderar las estadísticas a sufrir una caída drástica hasta niveles cercanos al 0,15. En contraposición, la educación superior muestra la tendencia más positiva, con un crecimiento constante que la ha llevado a triplicar sus valores iniciales y superar al resto de categorías en este último año.


Españoles por sexo y comunidad autónoma trabajando fuera del país el último año

El diagrama de dispersión muestra la relación entre hombres y mujeres que trabajan en el extranjero por regiones. En este escenario, Canarias ocupa una posición intermedia-baja, pero destaca por un aspecto interesante: la movilidad laboral femenina (3,1) es superior a la masculina (2,6). Esto indica que las mujeres han tenido una presencia ligeramente mayor en el mercado laboral extranjero durante el último año, aunque ambos sexos se mantienen lejos de los máximos nacionales.


Brecha de género en las personas españolas empleadas con educación primaria

Andalucía destaca notablemente por presentar los valores más altos y la mayor separación entre ambos grupos, seguida de cerca por Cataluña y Madrid. Canarias, por su parte, ocupa una posición intermedia en la tabla, mostrando una distancia clara entre géneros, aunque menos pronunciada que en las regiones más pobladas. Lo destacable de este gráfico es el gran tamaño de la brecha en la educación primaria en contraposición con la educación superior; se ruega visitar este apartado en el cuadro de mandos para observar la diferencia.


Mapa contratos indefinidos entre 2015 y 2022

El mapa muestra marcadores geográficos para cada isla, asociados al total de contratos indefinidos acumulados y al pasar el ratón por encima de un marcador, aparece una etiqueta con la cifra exacta de contratos. Las islas capitalinas asumen la mayoría de volumen de contratos, siendo Tenerife la isla líder. Por detrás le siguen Lanzarote con bastantes más contratos en relación a la población que Fuerteventura.


3.6 Modelado

Una vez realizada la preparación de los datos vemos que es de gran interés aplicar modelos sobre las tendencias de empleo en España.

Serie temporal de commuting en España


Unificamos ambas vectores de valores de la variable para estudiar la tendencia de la serie


Descomposición STL

Hemos realizado una descomposición de la serie temporal, que se ha dividido en la moda y el error. Podemos observar los errores más significativos en los años 2020 (pandemia COVID-19) y 2008 (crisis financiera en España). En general, vemos una clara tendencia al alza (recordemos que representa el número de personas empleadas a larga distancia). Ahora intentaremos predecir el comportamiento de esta variable en el futuro a través del modelo ARIMA.


La previsión futura (línea azul) preveé que esta cifra continuará subiendo hasta superar los 850.000 personas, y aunque el área sombreada refleja el margen de error en la estimación, vemos que la disposición a trabajar fuera de la región o país de origen no es un hecho aislado, sino un comportamiento continuado.


Haremos una interpolación de las épocas de cambios significativos en el empleo en España: crisis del 2008 y pandemia del 2020



Una vez rellenados los huecos con el modelo de interpolación, volvemos a hacer la descomposición STL

Como podemos observar, se ha reducido significativamente el error.


Ahora el margen de error en la estimación es mucho menor; la previsión obtenida es más exacta.


Serie temporal empleo en Canarias

La mayoría de los trabajadores desarrolla su actividad dentro de Canarias. Esta opción viene creciendo desde unas 600.000 personas a principios de siglo hasta rozar el millón en la actualidad.


Predicción para los próximos 10 años

El desplazamiento a otro país es la única variable que tiene una clara tendencia positiva en el futuro. Para hacer predicciones sobre ella, se ha calculado los valores específicos para esta variable según el modelo ARIMA, obteniendo la expresión (1−B)yn = c+εn



Ahora dibujamos el error de la predicción


Modelo ARIMA para valores de empleo previstos hasta el año 2030

Se preveé un crecimiento continuo para la próxima década. A partir de 2015 la tendencia se torna claramente ascendente, se estima que para el año 2030 superará los 7000 canarios desplazados de las islas por motivos laborales.


Correlación de trabajo en la misma región / trabajadores con educación superior

A la variable Commuting se le aplica una transformación logarítmica y a la variable Educación una función Yeo-Johnson (como un “ajuste automático” que busca la mejor forma matemática para que los datos se distribuyan minimizando la varianza). El parámetro lambda de la función YeoJohnson en este caso es 0.01695

La recta de regresión tiene forma: y = 1.062x - 1.247

La correlación entre variables es 0.95622698 (muy buena). La varianza de los residuos de los puntos respecto a la recta es 0.4632 y el coeficiente R2 equivale a 0.91437003


Visualización de componentes principales

El análisis de componentes principales consiste en reducir el número de variables con las que estamos trabajando en menos variables manteniendo la mayoría de información del modelo, aunque las variables construidas no tienen un sentido físico. El número de componentes principales resultantes significativas es de 3 (consultar cuadro de mandos). En este diagrama se muestra la primera componente en el eje X y la segunda componente en el eje Y. Los vectores de cada variable original se construyen a partir de los pesos de cada variable estandarizada


3.7 Evaluación

3.7.1 Evaluación de la metodología

La metodología CRISP-DM me resultó práctica para organizar el trabajo, sobre todo al estructurar las fases de comprensión, preparación y modelado de los datos. Creo que el enfoque en general ha sido efectivo, aunque presentó desafíos importantes en la etapa de combinación de los dos datasets principales. No estaban diseñados para combinarse directamente y exigieron una revisión de fechas y niveles territoriales. Aun así, la cohesión entre ambas fuentes se logró y me permitió analizar empleo, competencias digitales y nivel educativo de forma conjunta. La estrategia de fusión fue adecuada, aunque algunos años no estaban disponibles en ambos conjuntos y hubo que descartar ciertos cruces por falta de cobertura. Estas restricciones condicionaron el análisis, aunque no impidieron obtener conclusiones útiles para el proyecto.

3.7.2 Evaluación de los resultados

En general, los objetivos planteados se cumplieron. Fue posible analizar la correlación entre las variables y generar gráficos que aportan una lectura más fácil de los patrones laborales. Para mí, el hallazgo principal ha sido conseguir observar cómo la movilidad laboral varía según el nivel de formación, identificando regiones que muestran una dependencia entre sí. Esta relación entre cualificación y necesidad de moverse ha quedado reflejada en gráficos sencillos y comparables, que ayudan a interpretar mejor el fenómeno. Con estos resultados, se pueden empezar a plantear ideas concretas para orientar la inversión pública y mitigar los problemas de sostenibilidad derivados de los desplazamientos masivos.

3.8 Despliegue

La librería flexdashboard de R ha permitido generar el cuadro de mandos interactivo que se ejecuta en tiempo real. El objetivo principal ha sido transformar la rigidez de los datos puestos en tablas en una exploración que permitiera al usuario interactuar con la información.

En la fase de modelado, para las proyecciones a futuro he implementado un modelo ARIMA que calcula predicciones de niveles educativos a diez periodos vista. Del mismo modo, he optado por un Análisis de Componentes Principales (PCA) que reduce la dimensionalidad de los datos y permite observar agrupamientos de países en un plano simple, facilitando la interpretación de patrones que de otro modo quedarían ocultos. Además, al comparar atributos con distribuciones muy distintas, el sistema aplica transformaciones como Yeo-Johnson, lo que suaviza la varianza y mejora la linealidad en los análisis de regresión.

Respecto a la visualización, he puesto especial énfasis en gráficos que muestran múltiples dimensiones de información. Un ejemplo destacado en el proyecto es la construcción del Treemap (mapa de árbol) para analizar el peso de las comunidades autónomas. He realizado este gráfico definiendo una estructura de “padres e hijos”, donde el nodo raíz actúa como el total nacional y las ramas son las distintas comunidades. El área de cada rectángulo representa el volumen absoluto de población, mientras que la escala de color indica el porcentaje. Esto permite distinguir visualmente y de forma inmediata si una región destaca por tener mucha población o por tener una proporción muy alta del atributo estudiado, dos conceptos que a menudo se confunden en gráficos de barras tradicionales. Otro elemento a destacar es la Matriz de Correlación. Se calculan los coeficientes de correlación entre las variables de movilidad laboral (commuting) y los niveles educativos. Esto permite identificar rápidamente qué variables se mueven en la misma dirección y con qué intensidad, sirviendo como paso previo para validar las hipótesis del proyecto sobre la conexión entre formación y movilidad geográfica.

Por último, para llevar el análisis a nivel local he añadido datos del Instituto Canario de Estadística (ISTAC). Esta última sección se ha diseñado para ver las tendencias generales observadas anteriormente en el archipiélago. Por un lado, he implementado un mapa coroplético que permite identificar de un vistazo las disparidades de contratación entre las islas, funcionando como un filtro geográfico. Por otro lado, y quizás más relevante, he construido un gráfico de series temporales que combina el tipo de contrato (indefinido frente a temporal) con el nivel educativo. Esta visualización es clave porque no solo muestra el volumen de empleo, sino que permite discriminar su estabilidad; al interactuar con los filtros, se hace evidente cómo la curva de la contratación indefinida reacciona de manera distinta según la formación de la población, validando la relación entre estudios superiores y estabilidad laboral en Canarias.

4 Conclusiones y trabajo futuro

4.1 Conclusiones

El análisis confirmó que a mayor nivel de formación, aunque existe libertad de movimiento en Europa, los profesionales más preparados tienden a encontrar sus oportunidades en su entorno cercano (aunque la variable misma región está correlacionada con todos los indicadores de commuting porque tiene que ver en gran parte con la variable población global). Esta relación fue comprobada con la matriz de correlación y el análisis de componentes principales (PCA). A su vez, una de las conclusiones más significativas a la hora de mirar el mapa es que dónde vives importa más que tus estudios para trabajar en otro país. En el centro de Europa es muy común cruzar fronteras, pero en las zonas periféricas como la nuestra, tener carrera no garantiza que la gente se mueva al extranjero; la mayoría prefiere quedarse cerca. Además, hay una diferencia considerable entre los trabajadores con educación primaria, que apenas se mueven de país, y aquellos con educación secundaria o superior, que sí lo hacen con frecuencia.

Las predicciones a futuro han mostrado que el nivel educativo de las personas empleadas un país cambia muy despacio, los gráficos no muestran saltos bruscos. Mejorar la formación general de los trabajadores es un proceso lento que lleva muchos años y no se arregla de un día para otro. Las medidas de las que hemos hablado con anterioridad que deben tomar las agencias de empleo europeas deben ser con enfoques muy a largo plazo, sin intentar resolver los problemas de movilidad de un día para otro.

También es curioso que aunque las mujeres tienen tantos o más estudios que los hombres, ellos siguen desplazándose más lejos por trabajo. Esto indica que el freno no es la falta de títulos o formación, sino otras barreras sociales que hacen que ellas se muevan menos geográficamente.

Además, en España, aunque hombres y mujeres acceden por igual a la educación primaria, persisten brechas de género muy amplias en el mercado laboral. Sin embargo, en el caso de la educación superior la brecha de género es prácticamente inexistente y los datos indican que en los últimos años el empleo para este tipo de formación se ha equilibrado en cuanto a géneros.

En Canarias, los datos locales revelan que la formación superior estabiliza el empleo y reduce la temporalidad en los contratos (mayor número de contratos indefinidos). Por tanto, la conclusión más significativa se basa en que una formación íntegra protege contra la inestabilidad laboral. Se ve perfectamente cómo los trabajos básicos dependen mucho de otros factores como temporadas turísticas, mientras que los empleos cualificados tienen altas posibilidades de mantenerse fijos durante largas temporadas.

Sin embargo, el estudio tiene limitaciones importantes. Los datos europeos presentaban lagunas: faltaban algunos años y categorías, lo que redujo la capacidad de comparar datos y me obligó a descartar ciertos análisis. La combinación por territorios también omitió datos importantes para algunas regiones que no contaban con cobertura de datos en ambos datasets y me obligó a filtrar información, lo que podría introducir un ligero sesgo geográfico. Las predicciones estadísticas asumen que las tendencias pasadas continuarán, sin contar con posibles cambios económicos futuros. Finalmente, los datos detallados de Canarias no permiten comparar directamente la calidad del empleo con el resto de la Unión Europea al no tener las tablas exactamente el mismo formato.

Estas restricciones no invalidan los resultados, pero sí limitan su alcance y deben considerarse al interpretarlos.

4.2 Trabajo futuro

Creo que la contribución real de este análisis es una hoja de ruta visual para la toma de decisiones estratégicas de las organizaciones públicas. Por ejemplo, si se demuestra que las personas con alta cualificación se mueven masivamente entre ciertas regiones, es ahí donde tiene sentido invertir en mejores trenes o carreteras, y no en zonas donde la movilidad es estática. Del mismo modo, las predicciones sobre el nivel educativo a diez años vista ofrecen una alerta temprana a las empresas y gobiernos: si la curva de nuevos graduados se estanca, es necesario empezar a planificar hoy estrategias de captación de talento o reforma educativa para evitar la escasez de profesionales en la próxima década.

Mirando hacia adelante, el camino natural para enriquecer este estudio sería añadir una nueva capa de datos económicos y salarios de los trabajadores. Sería muy interesante combinar mis actuales gráficos de movilidad y educación con los ingresos reales para responder preguntas como ¿realmente compensa económicamente moverse de región? Esto nos permitiría ver para distintos niveles educativos si el desplazamiento se traduce en mejores sueldos y un fenómeno como la “fuga de cerebros” o si, por el contrario, la precariedad obliga a moverse sin compensación económica.

Por último, una línea de investigación a destacar sería analizar el impacto del “efecto post-pandemia”. Mis datos actuales reflejan principalmente el desplazamiento físico, pero la irrupción del teletrabajo está cambiando muchos patrones de movilidad. Un futuro estudio debería investigar si las regiones con alta educación están sustituyendo el commuting por el trabajo remoto, lo que cambiaría las necesidades de inversión en infraestructuras y la forma en que entendemos el mercado laboral europeo y canario.

Anexo. Seguimiento temporal actividades del proyecto

TOTAL HORAS TRABAJADAS EN EL PROYECTO : 70.9

DESGLOSE DETALLADO DE LAS SESIONES DE TRABAJO